草庐IT

实际有效的Python html解析

全部标签

ruby-on-rails - 我如何解析一个 Excel 文件,它会给我提供与视觉上完全一样的数据?

我正在使用Rails5(Ruby2.4)。我想阅读.xls文档,我想将数据转换为CSV格式,就像它出现在Excel文件中一样。有人推荐我使用Roo,所以我有book=Roo::Spreadsheet.open(file_location)sheet=book.sheet(0)text=sheet.to_csvarr_of_arrs=CSV.parse(text)但是,返回的内容与我在电子表格中看到的内容不同。例如,电子表格中的一个单元格有16:45.81当我从上面获取CSV数据时,返回的是"0.011641319444444444"如何解析Excel文档并准确获取我所看到的内容?我不在

ruby - 在 Ruby 中查找周期和范围集差异的有效方法

我在Ruby中有很多时间范围:period=Time.parse('8:00am')..Time.parse('8:00pm')incidents=[Time.parse('7:00am')..Time.parse('9:00am'),Time.parse('1:00pm')..Time.parse('3:00pm'),Time.parse('1:30pm')..Time.parse('3:30pm'),Time.parse('7:00pm')..Time.parse('9:00pm'),]我正试图在这段时间内获得一系列无事件block。对于以上内容:[Time.parse('9:00

ruby - 如何解析 Ruby 中以制表符分隔的文本行?

我发现Ruby的each函数有点令人困惑。如果我有一行文本,each循环会给我每个空格分隔的单词,而不是每个单独的字符。那么检索由制表符分隔的字符串部分的最佳方法是什么。目前我有:line.split.eachdo|word|...end但这并不完全正确。 最佳答案 我不确定我是否完全理解你的问题,但如果你想在制表符上拆分行,你可以将其指定为拆分的参数:line.split("\t").each...或者您可以将其指定为正则表达式:line.split(/\t/).each...Each基本上只是遍历数组中的所有项目,split从字

ruby - 作为开发人员,不同的 Ruby 线程模型(Ruby 与 JRuby)对您的代码有什么实际影响?

我试图了解MRIRuby1.8和JRuby之间不同线程模型的实际影响。作为开发者,这种差异对我意味着什么?另外,MRIRuby1.8中是否有任何实际代码示例会由于不同的线程模型而在JRuby上具有更差的性能特征? 最佳答案 状态ruby1.8有绿色线程,这些线程可以快速创建/删除(作为对象)但不是真正的并行执行,甚至不由操作系统调度,而是由虚拟机调度ruby1.9有真正的线程,由于操作系统调用,创建/删除(作为对象)很慢,但由于GIL(全局解释器锁)一次只允许一个线程执行,所以这些都不是真正的线程并行JRuby也有操作系统调度的真实

ruby - 如何从可能具有前导零的字符串中解析数字?

在ruby​​中,我正在解析以下格式的日期:24092008。我想将每个部分(年、月、日)转换为数字。我使用正则表达式将它们拆分,生成三个字符串,我将它们传递给Integer构造函数。date=~/^([\d]{2})([\d]{2})([\d]{4})/year=Integer($3)month=Integer($2)day=Integer($1)当它到达月份线时,它崩溃如下:`Integer':invalidvalueforInteger:"09"(ArgumentError)我花了一段时间才意识到它将前导零解释为八进制数,而09不是有效的八进制数(它与“07”一起工作正常)。是否

ruby-on-rails - Rails 3 - 'Couldn' t 解析 Yaml'

我不知道我做错了什么。我尝试运行“railsc”,但它只是给我一个错误。它在10分钟前工作。:\C:/Ruby192/lib/ruby/1.9.1/psych.rb:148:in`parse':couldn'tparseYAMLatline2column12(Psych::SyntaxError)fromC:/Ruby192/lib/ruby/1.9.1/psych.rb:148:in`parse_stream'fromC:/Ruby192/lib/ruby/1.9.1/psych.rb:119:in`parse'fromC:/Ruby192/lib/ruby/1.9.1/psych.

ruby - 我无法从 Nokogiri 解析的字符串中删除空格

我无法从字符串中删除空格。我的HTML是:CenaproVás:139 Kč我的代码是:#encoding:utf-8require'rubygems'require'mechanize'agent=Mechanize.newsite=agent.get("http://www.astratex.cz/podlozky-pod-raminka/doplnky")price=site.search("//p[@class='your-price']/strong/text()")val=price.first.text=>"139 "val.strip=>"139 "val.g

ruby - 在 Ruby 中将两个数组相乘并获得相乘值之和的有效方法是什么?

在Ruby中将两个数组相乘并获得相乘值之和的有效方法是什么?我在Ruby中有两个数组:array_A=[1,2,1,4,5,3,2,6,5,8,9]array_B=[3,2,4,2,5,1,3,3,7,5,4]我的目标是获取array_A*array_B的总和值,即1*3+2*2+1*4+...+8*5+9*4。因为我需要在我的应用程序中对它们进行数百万次计算,进行此类计算的最有效方法是什么?这就像矩阵计算:1*N矩阵*N*1矩阵或向量点积。 最佳答案 更新我刚刚根据新评论更新了基准。正在关注Joshua'scomment,注入(i

ruby - Ruby pre-1.9 和 Ruby 1.9 线程之间有什么实际区别吗?

我试图了解Ruby线程pre-1.9和1.9(在标准MRI实现中)之间的区别,但就您可以使用它们获得的好处而言,它们似乎几乎相同。这是正确的吗?以我有限的理解:1.9之前的线程是“绿色线程”,这意味着它们由Ruby解释器而非操作系统管理。这样做的一个结果是您永远无法实现真正​​的并发,因为您永远不会同时运行多个线程(即使您在多核/多处理器系统上)。(但是,如果执行在不同线程之间切换,您可以获得并发的外观,例如,如果一些程序运行而另一个程序正在等待I/O。)1.9线程是native线程,这意味着它们确实由操作系统管理。如果没有全局解释器锁,这将允许Ruby同时运行多个线程(在多核/多处理

支持 WikiWord 的 ruby​​ markdown 解析器?

我正在使用git-wiki用于我的个人笔记存储。它工作得很好,除了WikiWords在markdown解析阶段之前使用正则表达式转换为链接。这会弄乱很多东西,例如指向外部wiki页面的链接或block引号(如果我要引用某些内容,我不希望将WikiWord更改为链接)。是否有能够理解WikiLinks的基于ruby​​的Markdown解析器? 最佳答案 最好的解析器是基于C的解析器(upskirt/sundown),它的ruby​​迭代是红地毯:https://github.com/tanoku/redcarpet出于性能和安全原因